PLS-SEM là gì? Các bài nghiên cứu khoa học về PLS-SEM
PLS-SEM là một phương pháp phân tích thống kê dùng để mô hình hóa mối quan hệ nhân quả giữa các biến tiềm ẩn và biến quan sát trong dữ liệu phức tạp. Nó tập trung vào dự đoán và tối đa hóa phương sai giải thích, phù hợp với dữ liệu không chuẩn và mẫu nhỏ trong nghiên cứu khám phá.
Giới thiệu về PLS-SEM
Partial Least Squares Structural Equation Modeling (PLS-SEM) là một kỹ thuật thống kê hiện đại thuộc nhóm mô hình phương trình cấu trúc (SEM), được sử dụng để phân tích các mối quan hệ nhân quả giữa các biến tiềm ẩn (latent variables) và biến quan sát (observed variables). Không giống như các phương pháp SEM truyền thống dựa trên hiệp phương sai như CB-SEM, PLS-SEM hoạt động theo hướng dự đoán, tập trung vào tối đa hóa phương sai giải thích (explained variance) của các biến phụ thuộc trong mô hình.
PLS-SEM rất thích hợp cho các nghiên cứu khám phá, nơi lý thuyết còn mới và chưa được xác lập vững chắc. Kỹ thuật này đặc biệt phù hợp với dữ liệu có kích thước mẫu nhỏ, cấu trúc phức tạp, hoặc khi các giả định phân phối chuẩn của dữ liệu không được đáp ứng. Đây là lý do tại sao PLS-SEM được ứng dụng rộng rãi trong các ngành như marketing, quản trị, xã hội học, và khoa học hành vi.
Mục tiêu chính của PLS-SEM không phải là kiểm định sự phù hợp của mô hình lý thuyết với dữ liệu như CB-SEM, mà là để hiểu và dự đoán các mối quan hệ giữa các cấu trúc trong mô hình. Phương pháp này cho phép người dùng mô hình hóa các quan hệ phức tạp, đồng thời kiểm soát sai số đo lường ở cấp độ biến tiềm ẩn, giúp tăng độ chính xác của kết quả phân tích.
Thành phần của mô hình PLS-SEM
Một mô hình PLS-SEM hoàn chỉnh bao gồm hai phần chính: mô hình đo lường (measurement model) và mô hình cấu trúc (structural model). Mô hình đo lường mô tả mối quan hệ giữa các biến quan sát (indicators) và biến tiềm ẩn mà chúng đo lường. Có hai loại mô hình đo lường: phản xạ (reflective) và hình thành (formative). Trong mô hình phản xạ, các biến quan sát là kết quả biểu hiện của biến tiềm ẩn, trong khi trong mô hình hình thành, các biến quan sát đóng vai trò xây dựng nên biến tiềm ẩn.
Mô hình cấu trúc thể hiện mối quan hệ nhân quả giữa các biến tiềm ẩn trong mô hình. Mỗi đường dẫn (path) giữa hai biến tiềm ẩn thể hiện một giả thuyết nghiên cứu, và hệ số của đường dẫn đó cho biết mức độ ảnh hưởng của biến này lên biến kia. Việc kiểm định mô hình cấu trúc giúp đánh giá mức độ phù hợp của mô hình lý thuyết với dữ liệu thực tế.
Quy trình ước lượng trong PLS-SEM được thực hiện thông qua thuật toán PLS gốc, bao gồm ba giai đoạn: (1) ước lượng trọng số ngoài (outer weights), (2) tính điểm biến tiềm ẩn (latent variable scores), và (3) ước lượng các hệ số trong mô hình cấu trúc. Thuật toán này sử dụng phương pháp lặp để cải tiến các ước lượng cho đến khi hội tụ.
- Mô hình đo lường: Xác định quan hệ giữa biến quan sát và biến tiềm ẩn
- Mô hình cấu trúc: Thể hiện quan hệ giữa các biến tiềm ẩn
- Phân biệt mô hình phản xạ và hình thành
Thành phần | Vai trò | Ví dụ |
---|---|---|
Mô hình đo lường phản xạ | Biến quan sát phản ánh biến tiềm ẩn | Hài lòng khách hàng → mức độ hài lòng, sự sẵn lòng giới thiệu |
Mô hình đo lường hình thành | Biến quan sát tạo thành biến tiềm ẩn | Chất lượng dịch vụ ← độ tin cậy, sự đáp ứng, tính hữu hình |
Ưu điểm của PLS-SEM
PLS-SEM có một loạt ưu điểm giúp nó trở thành lựa chọn hàng đầu trong các nghiên cứu ứng dụng. Trước tiên là khả năng làm việc hiệu quả với dữ liệu không tuân theo phân phối chuẩn, điều mà CB-SEM yêu cầu nghiêm ngặt. Điều này cho phép các nhà nghiên cứu áp dụng PLS-SEM với dữ liệu thực nghiệm không chuẩn hóa mà vẫn đảm bảo độ tin cậy trong kết quả.
Thứ hai, PLS-SEM hoạt động tốt với kích thước mẫu nhỏ. Trong khi CB-SEM thường yêu cầu kích thước mẫu lớn (thường trên 200), PLS-SEM có thể hoạt động ổn định với cỡ mẫu từ 30–100 tuỳ vào độ phức tạp của mô hình. Đây là lợi thế quan trọng trong các nghiên cứu thực tế khi việc thu thập dữ liệu là một trở ngại.
Một điểm nổi bật khác là khả năng xử lý mô hình phức tạp có nhiều biến tiềm ẩn và chỉ số quan sát. PLS-SEM còn cho phép mô hình hóa các mối quan hệ tuyến tính và phi tuyến, các mô hình bậc hai (second-order models), và thậm chí kết hợp với kỹ thuật phân cụm hoặc phân tích nhóm.
- Không yêu cầu phân phối chuẩn
- Thích hợp với mẫu nhỏ
- Xử lý mô hình phức tạp và nhiều đường dẫn
- Hiệu quả trong dự đoán hành vi
Hạn chế của PLS-SEM
Mặc dù có nhiều ưu điểm, PLS-SEM cũng có một số hạn chế cần lưu ý. Một trong số đó là việc thiếu các chỉ số đánh giá độ phù hợp tổng thể của mô hình (global goodness-of-fit indices), như các chỉ số RMSEA hay CFI trong CB-SEM. Điều này khiến việc đánh giá mức độ “phù hợp tổng thể” của mô hình trong PLS-SEM khó khăn và đòi hỏi người dùng phải dựa vào nhiều chỉ số thành phần.
Thứ hai, nếu nhà nghiên cứu không xác định rõ loại mô hình đo lường (phản xạ hay hình thành), việc ước lượng có thể bị sai lệch nghiêm trọng, dẫn đến kết luận sai lệch về mối quan hệ giữa các cấu trúc. Ngoài ra, việc thiếu sự chuẩn hóa về báo cáo và diễn giải kết quả PLS-SEM cũng gây ra sự không nhất quán trong cộng đồng học thuật.
PLS-SEM cũng có xu hướng tạo ra các mô hình có hệ số đường dẫn cao hơn mức thực tế nếu dữ liệu bị nhiễu hoặc thiếu điều kiện cần thiết, điều này có thể dẫn đến quá khớp (overfitting). Do đó, PLS-SEM nên được sử dụng với cẩn trọng, đặc biệt trong nghiên cứu xác nhận lý thuyết.
- Không có chỉ số phù hợp mô hình tổng thể
- Rủi ro ước lượng sai nếu mô hình không thiết kế đúng
- Dễ dẫn đến overfitting trong mô hình lớn
Ứng dụng của PLS-SEM
PLS-SEM được ứng dụng rộng rãi trong nhiều lĩnh vực nghiên cứu thực nghiệm, nơi mà dữ liệu có cấu trúc phức tạp, lý thuyết chưa hoàn thiện hoặc mẫu nhỏ là đặc điểm thường thấy. Trong lĩnh vực marketing, PLS-SEM là công cụ phổ biến để xây dựng và kiểm định mô hình hành vi người tiêu dùng, ví dụ như đánh giá ảnh hưởng của nhận thức thương hiệu, niềm tin và sự hài lòng lên ý định mua hàng.
Trong ngành quản trị kinh doanh, PLS-SEM thường được dùng để phân tích các yếu tố ảnh hưởng đến năng lực cạnh tranh, chất lượng dịch vụ, hoặc sự trung thành của khách hàng. Ngoài ra, trong tâm lý học và khoa học xã hội, PLS-SEM giúp nghiên cứu các khái niệm trừu tượng như động lực nội tại, niềm tin, thái độ hay stress, bằng cách kết nối các biến đo lường gián tiếp qua các cấu trúc tiềm ẩn.
- Marketing: dự đoán hành vi khách hàng, đo lường giá trị thương hiệu
- Quản trị: phân tích năng lực tổ chức, chất lượng dịch vụ, chiến lược đổi mới
- Tâm lý: mô hình hóa thái độ, cảm xúc, hành vi xã hội
- Y tế công cộng: đánh giá chất lượng cuộc sống, hành vi chăm sóc sức khỏe
Phần mềm hỗ trợ PLS-SEM
Nhiều phần mềm chuyên biệt đã được phát triển nhằm hỗ trợ thực hiện phân tích PLS-SEM, trong đó nổi bật nhất là SmartPLS và WarpPLS. SmartPLS là phần mềm thân thiện với giao diện kéo-thả trực quan, cho phép người dùng dễ dàng thiết kế mô hình, nhập dữ liệu, chạy phân tích và xuất kết quả một cách trực quan, phù hợp cả cho nhà nghiên cứu học thuật và doanh nghiệp.
WarpPLS là phần mềm khác nổi bật với khả năng mô hình hóa các quan hệ phi tuyến giữa các biến tiềm ẩn. WarpPLS cung cấp nhiều chỉ số đánh giá chi tiết cho cả mô hình đo lường và cấu trúc, cùng tính năng kiểm tra độ bền mô hình (robustness analysis).
- SmartPLS: giao diện đồ họa, phù hợp người dùng không chuyên lập trình
- WarpPLS: hỗ trợ quan hệ phi tuyến, nhiều chỉ số thống kê nâng cao
- PLS Graph: phần mềm đầu tiên cho PLS, hiện ít dùng do hạn chế giao diện
So sánh PLS-SEM và CB-SEM
CB-SEM (Covariance-Based SEM) và PLS-SEM (Partial Least Squares SEM) là hai phương pháp thuộc nhóm mô hình phương trình cấu trúc, nhưng có mục tiêu và giả định thống kê khác nhau rõ rệt. CB-SEM được thiết kế để kiểm định sự phù hợp của một mô hình lý thuyết cụ thể, yêu cầu dữ liệu có phân phối chuẩn, và mẫu lớn để đảm bảo tính ổn định của các ước lượng. Trong khi đó, PLS-SEM tập trung vào việc tối đa hóa phương sai giải thích của các biến phụ thuộc, thích hợp hơn trong các nghiên cứu dự đoán.
Bảng dưới đây tổng hợp những điểm khác biệt chính giữa hai phương pháp:
Tiêu chí | PLS-SEM | CB-SEM |
---|---|---|
Phân phối dữ liệu | Không yêu cầu phân phối chuẩn | Yêu cầu phân phối chuẩn |
Kích thước mẫu | Hoạt động tốt với mẫu nhỏ | Yêu cầu mẫu lớn |
Mục tiêu | Dự đoán và phát triển lý thuyết | Kiểm định lý thuyết hiện có |
Đánh giá mô hình | Dựa vào R², AVE, path coefficients | Dựa vào chỉ số phù hợp mô hình tổng thể (RMSEA, CFI,...) |
Việc lựa chọn giữa hai phương pháp nên dựa trên mục tiêu nghiên cứu, đặc điểm dữ liệu và cấp độ phát triển của lý thuyết.
Tiêu chí đánh giá mô hình PLS-SEM
Để đánh giá chất lượng mô hình trong PLS-SEM, người nghiên cứu cần xem xét các tiêu chí cho cả mô hình đo lường và mô hình cấu trúc. Đối với mô hình đo lường phản xạ, độ tin cậy được đo bằng chỉ số Cronbach’s Alpha và Composite Reliability (CR), trong đó CR nên > 0.7 là chấp nhận được. Độ hội tụ được đánh giá bằng AVE (Average Variance Extracted), cần lớn hơn 0.5.
Độ phân biệt được kiểm tra thông qua Fornell-Larcker Criterion và HTMT (Heterotrait-Monotrait Ratio). Giá trị HTMT dưới 0.85 hoặc 0.90 tùy theo tiêu chuẩn, cho thấy sự phân biệt rõ giữa các biến tiềm ẩn. Đối với mô hình cấu trúc, hệ số đường dẫn (path coefficients), giá trị p và giá trị R² được sử dụng để kiểm định ảnh hưởng giữa các biến.
- Cronbach’s Alpha, Composite Reliability > 0.7
- AVE > 0.5
- HTMT < 0.90
- Path coefficient có giá trị p < 0.05 để được coi là có ý nghĩa thống kê
Hướng dẫn thực hiện PLS-SEM
Quy trình triển khai phân tích PLS-SEM có thể được tóm tắt qua năm bước chính. Đầu tiên, người nghiên cứu cần xây dựng mô hình nghiên cứu và xác định các giả thuyết liên quan. Tiếp theo là giai đoạn thiết kế công cụ đo lường, thường là bảng hỏi, và thu thập dữ liệu thực nghiệm từ đối tượng khảo sát phù hợp với mô hình lý thuyết.
Bước thứ ba là kiểm định mô hình đo lường, trong đó các chỉ số như độ tin cậy, AVE, và phân biệt được phân tích. Nếu đạt yêu cầu, chuyển sang bước thứ tư – kiểm định mô hình cấu trúc thông qua hệ số đường dẫn và kiểm định giả thuyết. Cuối cùng, người nghiên cứu tổng hợp kết quả, đánh giá các ảnh hưởng có ý nghĩa và đưa ra kết luận phù hợp với mục tiêu nghiên cứu.
- Xây dựng mô hình lý thuyết và giả thuyết
- Thiết kế công cụ khảo sát và thu thập dữ liệu
- Đánh giá mô hình đo lường (CR, AVE, HTMT)
- Đánh giá mô hình cấu trúc (path, R², p-value)
- Diễn giải kết quả và rút ra kết luận
Kết luận
PLS-SEM là một công cụ mạnh trong phân tích dữ liệu định lượng, đặc biệt phù hợp cho các nghiên cứu có mục tiêu khám phá hoặc dự đoán. Ưu điểm về khả năng làm việc với mẫu nhỏ, dữ liệu không chuẩn và mô hình phức tạp giúp PLS-SEM trở thành lựa chọn chiến lược trong nhiều ngành khoa học ứng dụng.
Tuy nhiên, do một số hạn chế về đánh giá độ phù hợp tổng thể và tính chính thống trong kiểm định lý thuyết, PLS-SEM cần được sử dụng một cách thận trọng và kết hợp với các tiêu chuẩn báo cáo nghiêm ngặt. Việc lựa chọn giữa PLS-SEM và CB-SEM không nên chỉ dựa trên sự tiện lợi, mà phải dựa trên mục tiêu nghiên cứu và đặc điểm dữ liệu cụ thể.
Các bài báo, nghiên cứu, công bố khoa học về chủ đề pls sem:
Tác giả thảo luận về thiên lệ phương pháp chung trong bối cảnh mô hình phương trình cấu trúc sử dụng phương pháp bình phương tối thiểu phần (PLS-SEM). Hai tập dữ liệu đã được tạo ra thông qua mô phỏng Monte Carlo để minh họa cho cuộc thảo luận: một tập bị ô nhiễm bởi thiên lệ phương pháp chung, và tập kia không bị ô nhiễm. Một phương pháp thực tiễn được trình bày để xác định thiên lệ phương pháp c...
... hiện toàn bộ- 1
- 2
- 3
- 4
- 5
- 6
- 10